自助法
"总有人抱怨训练集训练出来的模型不是最完整的模型,于是自助法出现了"
Main Idea
这样,我们要想获得基于m个数据的模型,我们就可以直接选m个作为训练数据,把没选到的作为验证集即可。
而不出现的数据占总数据的比率约为(设m为要选取的训练数据个数)
也就是说,我们就算用m个样本来训练,我们要有大概1/3的数据来作验证集,这样的测试结果也叫包外估计